老码农的AI漫谈

Original 半吊子全栈工匠喔家ArchiSelf 2022-10-26

收录于合集

“ 不认识整体就不可能认识局部，同样，不认识局部也不可能认识整体。” ——布莱士·帕斯卡(Blaise Pascal）

AI 切实地来到了人们的身边，从迷惑到振奋，从憧憬到期盼，从百家争鸣到百花齐放，从每个人到每个组织，都在或多或少地在寻找自己的定位。作为一个从业者，曾经试图从计算机的体系结构解读AI的构成（参见《老码农眼中的简明AI》），试图从溯源中看到AI的成长（参见《人工智能简史》读后），试图从伦理学角度审视AI的约束（参见《人工智能伦理学的一知半解》）......

但是，老码农仍然妄想对AI有一个整体性的全貌，然而能力所限，原以为的AI体系架构演变成了漫谈。下面是本次漫谈的目录：

AI 的诞生与三次浪潮
AI 的含义解读
AI 的技术体系
AI 的应用领域
AI 对社会的影响
AI 的未来

“治学先治史”，时光回溯，看一看AI出现在历史长河中的位置吧。

1. AI 的诞生与三次浪潮

在共和国诞生的第二年（1950年），图灵发表了一篇划时代的论文，提出了著名的图灵测试（ The Turing Test）——

在测试者与被测试者（一个人和一台机器）隔开的情况下，通过一个装置（例如显示器与键盘）向被测试者随意提问。进行多次测试后，如果有超过30%的测试者不能确定出被测试者是人还是机器，那么这台机器就通过了测试，并被认为具有人类智能。这是从现象和结果表象来判定AI的一种方式。

从1950年至1970年形成了AI早期发展的热潮，形成了符合主义，连接主义和行为主义三大主要的AI学派。符号主义认为AI 源于数理逻辑，其原理主要为物理符号系统假设和有限合理性原理。连接主义认为AI源于仿生学，特别是对人脑模型的研究，其主要原理为神经网络及神经网络间的连接机制与学习算法。行为主义认为AI源于控制论，其原理为控制论及感知-动作型控制系统。进而，专家系统一度被认为是AI 的典型代表。专家系统是基于AI的计算机系统，其内部含有大量的某一领域专家水平的知识，系统能利用这些知识和解决问题的方式来处理该领域的问题。

1956年，达特茅斯会议标志着AI 的诞生，除了那张广泛传播的照片之外，下图是那次会议中被成为“AI之父”的科学家们——

在“AI寒冬”之后，在语音识别领域中，统计学派逐渐取代了专家系统，机器学习成为AI实现的主力军。机器学习是通过计算机来模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构并使之不断改善自身的性能。同时，神经网络开始应用于模式识别等领域，使得连接主义重获新生。统计学的应用，机器学习和神经网络形成了1980～2000年间AI的第二次发展浪潮。

随着互联网的兴起，大数据得到了广泛的应用，在2006年后形成了第三次发展的浪潮。简单地，大数据是指无法在一定时间内用常规软件采集、管理并处理的数据集，需要新的处理模式才能具有更强的决策力、洞察力和流程优化能力，才能处理的海量高增长并且具有多样性的信息资产（可以参见《架构大数据应用》）。非深度的机器学习仍然有着典型的应用场景，而深度学习开始占领高地。深度学习是指通过组合低层次特征形成更加抽象的高层次特征来表示属性类别，进而发现数据的分布式特征。在机器视觉、语音识别、机器翻译等领域，深度学习有着普遍的应用，同时促进了强化学习，迁移学习，生成对抗网络等新技术的发展。其间的一个标志性事件，是AlphaGo的人机围棋大战。

关于AI发展的更多通俗性解释，可以参考《人工智能简史》。

那么，AI 到底是什么呢？

2. AI 的含义解读

普通人对AI的认识往往来自于科幻电影，从《星球大战》到《终结者》，从《太空漫游》到《星际穿越》。然而，电影是虚构的，那些电影中的角色也是如此，使人们觉得AI往往缺乏真实感。

AI 是近似于人类的生物学大脑么？

AI 是近似于人类的思考逻辑么？

AI 是近似于人类的行为方式么？

......

从实用的角度看， AI 是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门技术科学，是计算机科学的一个分支。

通俗地，人们把AI划分为不同的层次——弱AI，强AI和超级AI。弱AI是擅长于单个领域的人工智能，比如AlphaGo。强AI也称通用AI，是人类级别的人工智能，是指在各个方面都能和人类比肩的AI。创建强AI比创造弱AI要困难的多，因为智能是一种宽泛的心理能力，能够进行思考、计划、解决问题、快速学习并从经验中学习，能够抽象思维并理解复杂理念，强AI在进行这些操作时和人类一样，这已经有了造物主的味道。超级AI则是在几乎所有领域都比人类大脑聪明，包括通识、社交和科学创新，这是“Matrix”么？

一般地，人工智能科学主要是研究和开发出智能实体，在这一点上它属于工程学。AI的基础学科包括数学、逻辑学、系统学、控制学、计算机科学等，还包括哲学、心理学、生物学、神经科学、仿生学、经济学和语言学等其他学科的研究，是一个集数门科学精华于一身的尖端科学，是一门综合学科。

3. AI 的技术体系

既然AI是一门综合的科学，那AI技术体系是怎样的呢？

根据波普尔的知识进化图谱，发现问题是科学成长的起点，可以尝试对AI的技术体系做如下分类：

问题领域
学科基础
实现方式

AI 所处理的问题领域

语言识别、语言理解和机器翻译是AI的重要领域，自然语言处理（NLP）是人工智能头顶上的皇冠。字符识别、手写识别和机器视觉是AI的又一重要领域，而知识推理和自动控制则是反馈处理的核心方面，处理这些领域的问题，才使得AI 具备了类似“听说读写”的能力。

（来自 gogeometry.com）

AI 体系的技术基础

AI技术体系基础可能就是数学、计算机和数据。从微积分到线性代数，从集合论到概率统计，图论、信息论和博弈论等都在AI所处理的问题领域中得到应用。

如果数学是AI的理论基础，则计算机科学是AI的实现工具和方式。理解计算机组成原理，掌握编程语言并熟知操作系统，从计算机网络与通信到分布式系统，这些可能都是构建人工智能系统不可或缺的要素。“巧妇难为无米之炊”，AI技术体系的基石是数据，尤其是大数据的应用。

数据、信息、知识、洞见和智慧的关系如下图所示——

国外有一高手将相关技术绘制成了一张地铁路线图——

无独有偶，国内的高手们画了一张类似的图，只不过叫做“数据科学家能力发展路线图”。

简单地，数据（包括领域知识），数学（包括各种算法）和计算（包括分布式系统）构成了AI的核心基础。

AI 的技术实现方式

目前，AI 系统的技术实现方式可能主要是通过机器学习包括深度学习来实现的。机器学习的简要分类如下：

机器学习的基础是评估方法和特征工程，算法和模型是机器学习的核心。机器学习的算法众多，从线性回归到逻辑回归，从决策树模型到支持向量机，从贝叶斯分类到K均值聚类，当然还有当红的基于神经网络的深度学习，常见的有CNN，RNN，GAN，LSTM以及各种算法的变种。在机器学习中，常见的转换函数如下——

从计算机的体系架构来看，机器学习的计算架构按粒度从小到大可以分为：

AI芯片->
库与计算框架->
虚拟化容器->
分布式计算->
云服务

始于硬件芯片，止于云服务，中间可能还可以分为更多的层次。AI芯片多用于硬件加速，很多企业也都在这个领域发力，例如百度的NLP芯片——鸿鹄，一张AI芯片的不完整统计图如下：

用于机器学习的库和计算框架丰富多彩，按音序排列有——

Caffe
Microsoft CNTK
MXNET
PaddlePaddle
scikit-learn
TensorFlow
Theano
Torch

目前还在增长中，不再一一列举。

从部署方式上看，基于Docker 虚拟化容器的AI计算环境已经有相对成熟的方案，基于Hadoop 和 spark 的分布式架构应用广泛，基于对算力的渴望，提供AI计算能力的云服务给人们带来了福音，支持机器学习的云服务有Google的Cloud ML，微软的 Azure ML以及Amazon 的ML等等。

数据的可视化解决方案是机器学习中的一个重要环节，同时，知识图谱、统计模型、遗传算法、博弈算法等等，也都有着典型的应用场景。

那么，能够应用AI 的领域有哪些呢？